Soit X une variable aléatoire discrète prenant ses valeurs de 0 à 5. On considère l’échantillon ci-dessous :
valeurs |
0 |
1 |
2 |
3 |
4 |
5 |
effectifs |
0 |
23 |
33 |
76 |
47 |
21 |
1) Il y a 200 valeurs. La moyenne des données groupées est donc :
m = (0 x 0 + 23 x 1 + 33 x 2 + 76 x 3 + 47 x 4 + 21 x 5 ) / 100
On trouve : m = 3
La variance est la moyenne (pondérée) des carrés moins le carré de la moyenne :
s2 = (0 x 02 + 23 x 12 + 33 x 22 + 76 x 32 + 47 x 42 + 21 x 52 ) / 100 – 32 = 1.58
m = 3 |
s2 = 1.58 |
On remarque qu’effectivement la valeur 0 n’est jamais observée. Supposons qu’il s’agisse de la loi uniforme sur {1,...,5}. La moyenne théorique et la variance théorique de cette loi sont :
m = (n + 1) / 2 |
s2 = (n2–1) / 12 |
On en déduit :
m = 3 |
s2 = 2 |
La moyenne observée m est égale à la moyenne théorique m. La variance observée s2 est nettement inférieure à la variance théorique s2. On peut penser que la loi uniforme sur {1,...,5} est possible malgré tout.
2) On suppose que la loi de X est la loi binomiale pour n = 5 . On cherche p de façon que la moyenne théorique m soit égale à la moyenne observée m :
n x p
= 3 |
Þ |
p = 3 / 5 |
La variance théorique est alors :
s2 = n x p x (1 – p) = 5 x 3/5 x 2/5 = 1.2
p = 0.6 |
m = 3 |
s2 = 1.2 |
La loi binomiale paraît vraisemblable autant que la loi uniforme.
3) On considère maintenant une v.a. Z prenant ses valeurs dans {1, 2, 3, 4, 5} dont la loi de probabilité est définie par p1, ..., p5 avec :
p2 = 2 p1 |
p3 = 4 p1 |
p4 = 2 p1 |
p5 = p1 |
On a :
p1 + p2 + p3 + p4 + p5 = p1 (1 + 2 + 4 + 2 + 1) = 10 p1
Cette somme doit être égale à 1. On en déduit :
p1 = 1/10 |
p2 = 2 /10 |
p3 = 4 /10 |
p4 = 2 /10 |
p5 = 1/10 |
La moyenne théorique est :
m = |
p1 x 1 + p2 x 2 + p3 x 3 + p4 x 4 + p5 x 5 |
= |
(1 + 2 x 2 + 4 x 3 + 2 x 4 + 1 x 5 ) /10 |
= |
3 |
La variance théorique est :
s2 = |
p1 x 12 + p2 x 22 + p3 x 32 + p4 x 42 + p5 x 52 – 32 |
= |
(1 + 2 x 22 + 4 x 32 + 2 x 42 + 1 x 52 )
/10 – 9 |
= |
102 / 10 –9 |
= |
1.02 |
m = 3 |
|
s2 =1.02 |
5) Les moyennes théoriques des trois lois proposées sont égales à la moyenne observée. On peut donc retenir la loi dont la variance est la plus proche : c’est la loi binomiale.
Un autre critère consiste à comparer les probabilités théoriques aux proportions observées.
La table ci-dessous donne les probabilités théoriques des lois considérées et les proportions observées :
X |
loi uniforme |
loi binomiale |
loi de Z |
proportions observées |
0 |
0 |
0.01024 |
0 |
0 |
1 |
0.2 |
0.07680 |
0.1 |
0.115 |
2 |
0.2 |
0.23040 |
0.2 |
0.165 |
3 |
0.2 |
0.34560 |
0.4 |
0.380 |
4 |
0.2 |
0.25920 |
0.2 |
0.235 |
5 |
0.2 |
0.07776 |
0.1 |
0.105 |
Pour comparer les lois théoriques à la répartition observée, on peut calculer la somme des carrés des différences :
loi uniforme – loi observée : |
0.0511 |
loi binomiale – loi observée : |
0.0084 |
loi de Z – loi observée : |
0.0031 |
Suivant ce critère, c’est la loi de Z que l’on choisit. Nous donnons dans le chapitre 5 le critère statistique qu’il est préférable d’utiliser (le c2).